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sowie fehlerbehafteten Systemen. Hierfur wird vorgeschlagen, 



(57) Abstract: The invention relates to a method 
and an arrangement for randomly storing data in 
storage networks and/or an intranet and/or the internet, 

a corresponding computer program product, and a 
corresponding computer-readable storage medium, 
which are particularly suitable for distributing and 
retrieving data in error-tolerant and faulty systems such 
as storage networks or the internet. According to the 
inventive method for randomly storing data in storage 
networks and/or an intranet and/or the internet, one or 
several intervals, the total length of which corresponds 
to the relative capacity of the system, is/are assigned 
to each storage system. Said intervals are represented 
in a [0,1) interval but can overlap with other intervals 
as opposed to existing strategies. A real point is then 
assigned to each data block within the [0,1) interval 
by means of a (pseudorandom function. Optionally, 
said point can be part of several intervals of storage 
systems. A uniform placement strategy is used in order 
to assign the data block to one of said storage systems 
if that is the case. The interval lengths are adjusted 
correspondingly if the relative capacities of the storage 
systems change. 

(57) Zusaminenfassung: Die vorliegende Erfindung 
beschreibt ein Verfahren und eine Anordnung zur ran- 
domisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und 
ein entsprechendes computerlesbares Speichermedium, 
welche insbesondere einsetzbar sind fur die Verteilung 
und das Wiederauffinden von Daten in fehlertoleranten 

[Fortsetzung aufder ndchsten Seite } 
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dass bei dem Verfahren zur randomisierten Datenspeicherung in Speichemetzwerken und/oder einem Intranet und/oder dem Internet 
jedem Speichersystem ein oder mehrere Intervalle zugeordnet werden. Diese Intervalle werden auf ein [0,1)-Intervall abgebildet, 
konnen sich aber im Gegensatz zu friiheren Strategien mit anderen Intervallen uberlappen. Jedem Datenblock wird nun mittels 
einer (pseudo- )zufalligen Funktion ein reeller Punkt im [0,1)-Intervall zugewiesen. Dieser Punkt kann zu mehreren Intervallen 
von Speichersystemen gehoren. Falls dem so ist, wird eine uniforme Platzierungsstrategie verwendet, um den Datenblock einem 
dieser Speichersysteme zuzuweisen. Verandem sich die relativen Kapazitaten der Speichersysteme, so werden die IntervalUangen 
angepasst- 
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Verfahren und A^iordnung' zur random±siert:en 
Datenspeicherung 

10 



15 

Besclireibung 



2 0 Die vorliegende Erfindung betrifft ein Verfahren und 
eine Anordnung zur randoinisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/oder dem 
Internet sowie ein entsprechendes Computerprogramm- 
Erzeugnis und ein entsprechendes computerlesbares 

25 Speichermedium, welclie insbesondere einsetzbar sind fur 
die Verteilung und das Wiederauf f inden von Daten in 
f ehlertoleranten sowie f ehlerbehaf teten Systemen, wie 
beispielsweise Speichernetzwerke, einem Intranet oder 
dem Internet . 

30 

Die Organisation von mehreren Datenspeichersystemen als 
effizientes und flexibles Speichersystem erfordert die 
liosung zahlreicher Aufgaben. Eine der wichtigsten ist 
es, eine geeignete Datenplatzierung, d. h. eine geeig- 
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nete Strategie zur Verteilung der Datenblocke liber das 
Speicher system zu finden, die einen schnellen Zugriff 
auf die Daten und eine hohe Sicherheit gegen Daten- 
verlust erlaubt. Im Rahman der Beschreibung wird im 
5 Folgenden zwischen einer Menge von auf die Datenblocke 
zugreifenden Einheiten, den Clients, und einer Menge 
von Einheiten, die Datenblocke ausliefert, den Servern, 
unterschieden. Die Begriffe Server und Datenspeicher- 
system werden dabei synonym verwendet. 

10 

Die im Folgenden betrachteten Verfahren und Systeme 
dienen zum Aufbau von verteilten Datenservern und 
Speichernetzwerken, sowie zum Aufbau von Web-Systemen 
zum Caching von Daten. Ein verteilter Datenserver, bzw. 

15 ein Speichernetzwerk, besteht im Allgemeinen aus einer 
Menge von Computersystemen, die liber ein Netzwerk mit 
einer Menge von Datenspeichersystemen, verbunden sind. 
Das Verbindungsnetzwerk zwischen den Computersystemen 
und den Datenspeichersystemen besteht aus einer Menge 

20 von Switches bzw. Routern, die eine Zustellung der 
Datenpakete zwischen kommunizierenden Einheiten 
sicherstellen (siehe Figur 1) . Weiterhin kann das 
System liber eine Menge von SAN-Appliances (SAN 
Storage Area Network) verfugen, die an das Netzwerk 

25 angekoppelt sein konnen und ein Koordination zwischen 
den einzelnen Computersystemen und den 

Datenspeichersystemen sicherstellen (siehe Figur 2) . 
Weiterhin konnen so genannte In-Band-Appliances 
zwischen die Computersysteme und die Daten- 

3 0 speichersysteme geschaltet werden (siehe Figur 3) . In- 
Band-Appliances finden bei der so genannten In~Band- 
Virtualisierung Verwendung. Bei der In-Band- 
Virtual is ierung befindet sich die Kontrollinstanz , die 
In-Band-Appliance, im Datenstrom zwischen Server und 
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Speicher, Die Steuerdaten wie auch die Nutzdaten laufen 
durch die Appliance, die den Servern als das 
Speicher system selbst ersclieint. Die Zuordnung von 
Speicher segment en, auch als logische Volximes 
5 bezeichnet, zu jedem einzelnen Server geschieht hier. 
Ebenso passiert die Steuerung des Datenzugrif f s liber 
diese Appliance- Demgegentiber gibt es auch den Ansatz, 
die Virtualisierung liber die so genannte Out-of-Band- 
Virtualisierung zu realisieren. In diesem Falle 

10 befindet sich die Appliance auSerhalb des Datenpfades 
und kommuniziert iiber das Netzwerk (beispielsweise ein 
LAN) mit dem Host-Bus-Adapter (HBA) im Server, der 
einen speziellen Agenten benotigt. Die Appliance 
definiert die logischen Volumes, die ein Server 

15 benutzen darf. Die exakten Inf ormationen uber die 
zugehorigen logischen und physischen Blocke speichert 
der Server anschlieEend auf seinem HBA. In-Band verftigt 
uber den Vorteil, sich unkompliziert ins Speichernetz 
integrieren und warten zu lassen. Da In-Band im 

2 0 Datenpfad operiert, lasst sich die Datensicherheit 
durch eine Storage-Firewall in der SAN-Appliance mit 
geringem Auf wand erhohen- Out-Band gestaltet sich auf 
Grund der Wechselwirkungen zwischen den zusatzlichen 
Agenten auf den Applikationsservern und der SAN- 

25 Appliance komplexer. Im Gegensatz zu In-Band belegt 
diese Methode im Switch nur wenige Ports, so dass vor 
allem bei groiSen redundant ausgelegten SANs eine hohere 
Skalierbarkeit zur Verfugung steht. Zudem behindert ein 
Ausfall der SAN-Appliance den Datenzugrif f nicht . Im 

30 Falle des Einsatzes von In-Band-Appliances werden alle 
Lese/ Schreib-Operationen der an die In-Band- Appliances 
angeschlossenen Computer syst erne erst von einer der In- 
Band- Appliances entgegengenommen, bevor sie an die 
Speichersysteme weitergeleitet werden. Die 
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Funktionalitat zum Management und zur Verteilung der 
Daten kann dabei sowoh.1 in die Computersysteme, in die 
Router, als auch in die In-Band-Appliances integriert 
werden. Es wird im weiteren Verlauf davon ausgegangen, 
5 dass die an ein Speichernetzwerk bzw. einen verteilten 
Dateiserver angeschlossenen Computersysteme uber alle 
fiir das Auffinden von Daten notwendigen Inf ormationen 
ver f ligen . 

10 Ein Web-Cache ist eine Einheit in einem Netzwerk, die 
stellvertretend fiir einen oder mehrere Web-Server 
Zugriffe von Web-Clients beantwortet . Urn diese 
Funktionalitat zur Verfugung zu stellen, verfugt der 
Web-Cache uber ein Speicher system, auf dem Telle der 

15 Inhalte der Web-Server gespeichert werden. Speichert 
der Web-Cache die von einem Client angefragten 
Information nicht, so wird die Anfrage an einen 
ubergeordneten Web-Cache, bzw. den ursprtinglichen Web- 
Server weitergeleitet und von diesem beantwortet. Web- 

2 0 Caches erfreuen sich aus verschiedenen Griinden einer 

weiten Verbreitung im Internet. Durch den Einsatz eines 
Web-Caches kann die Latenzzeit, die zwischen dem 
Stellen einer Anfrage von dem Web-Client bis zu der 
erf olgreichen Auslieferung der Inf ormationen .an den 
25 Web-Client vergeht, signifikant reduziert werden. Die- 
ses trifft besonders dann zu, wenn die Bandbreite zwi- 
schen dem Web-Cache und dem Web-Client grower als die 
Bandbreite zwischen dem Web-Server und dem Web-Client 
ist Oder wenn die Belastung des Web-Servers so hoch 

3 0 ist, dass es bei der Auslieferung der Daten in dem Web- 

Server selbst zu Stauungen kommt. Weiterhin kann durch 
den Einsatz von Web-Caches der Datenverkehr im Internet 
reduziert werden, wodurch eine Steigerung der Lei- 
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stungsf ahigkeit des gesamten Systems Internet erzielt 
werden kann. 

Durch die Kooperation mehrerer Web-Caches, die an ver- 
5 schiedenen Orten des Internets platziert werden, kann 
die Leistungsf ahigkeit des Internets deutlich erhoht 
werden. Beispielsweise fiir die kooperative Zusammen- 
arbeit mehrerer Web-Caches sind das NLANR (National 
Laboratory of Applied Network Research) Caching- System, 
10 dass aus einer Menge von Backbone-Caches in den USA 
besteht, oder das Akamai Caching- System, das Caching- 
Services fiir Unternehmen auf der ganzen Welt bereit- 
stellt . 

15 Der Hauptunterschied in der Bereitstellung von Ver- 
fahren zvjxi Wiederauf f inden von Daten in Speichernetz- 
werken bzw. vert eil ten Dateiservern und fiir Web-Caches 
besteht darin, dass im Falle von Speichernetzwerken die 
angeschlossenen Computersysteme liber alle Inf oarmationen 

2 0 bezliglich der Platzierungsstrategie verftigen, die zum 

Wiederauf f inden der von ihnen verwendeten Daten not- 
wendig sind. Dieses umfasst unter anderem die Anzahl 
und die Eigenschaf ten der angeschlossenen Server, 
respektive der Datenspeichersysteme . Im Falle von Web- 
25 Caches verfugt der Client hingegen nur iiber eine 
beschrankte Sicht des Gesamtsys tems , d. h. er kennt 
nicht alle an das System angeschlossene Web-Caches. 
Werden nicht alle Daten auf alien Web-Caches ge- 
speichert, kann dieses dazu fiihren, dass der Web-Client 

3 0 ein Datum nicht von einem Web-Cache, sondern nur direkt 

vom Web-Server anfordern kann, da er entweder keinen 
Web-Cache kennt, der die von ihm angefragten Informa- 
tionen speichert, oder weil er zwar den fur ihn re- 
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levanten Web-Cache kennt, jedoch diesen Web-Cache nicht 
als ftir dieses Datum zustandig identif izieren- kann. 

Urn eine hohe Effizient, Skalierbarkeit und Robustheit 
5 eines Datenspeichersystems , bzw. eines Web-Caches 
sicherzustellen, sind eine Reihe von Anf orderungen zu 
erfiillen. Eine geeignete Datenverwaltungsstrategie 
sollte : 

10 1. jede anteilsmaSige Aufteilung der Datenblocke auf 
die Speichersysteme erfiillen konnen. Fiir identische 
Systeme wird in der Regel die gleichmaSige Ver- 
teilung der Datenblocke liber die Systeme gef ordert . 
2. es erm5glichen, die Datenfragen gemaS der anteils- 

15 maSigen Zuordnung der Datenblocke an die Daten- 

speichersysteme verteilen zu konnen. Fur den Fall 
unterschiedlicher Zugrif f shauf igkeiten auf Daten- 
blocke ist dieser Punkt nicht automatisch durch 
Punkt 1 sichergestellt . 

20 3. f ehlertolerant sein, d. h. Ausfalle von Datenspei- 
chersystemen ohne Datenverlust tiberstehen konnen. 
Die verlorenen Telle sollten in moglichst kurzer 
Zeit neu generiert werden konnen. 
4. sicherstellen, dass bei einer Hinzufiigung oder 

25 Wegnahme von Datenspeichersystemen nur moglichst 

wenige Datenblocke replatziert werden miissen, urn 
die oberen Punkte wieder herzustellen . Dieses 
sollte moglichst ohne spiirbare Beeintrachtigung des 
laufenden Betriebs geschehen. 

3 0 5. eine kompakte Speicherung und effiziente Berechen- 
barkeit der Platzierung sicherstellen. 



Verftigt der Client nur tiber unvollstandige Informatio- 
nen liber die Verteilung der Daten liber die Datenspei- 
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chersysteme, wie z. B. der Client von Web-Caches, so 
muss zusatzlich der folgende Punkt unterstutzt werden: 

6. auch wenn der Client nur liber unvollstandige , bzw. 
5 falsche inf oritiationen liber den Aufbau des Speicher- 

systems verfiigt, muss die Datenplatzierungsstrate- 
gie sicherstellen, dass eine hochst mogliche Anzahl 
von Zugriffen auf das Speichersystem erfolgreich 
ist, d. h. an einen die Inf ormationen speichernden 
10 Server gestellt werden. 

Es gibt im Wesentlichen zwei Standardstrategien fur die 
Speicherung von Daten in Fes tplattensys tern: 

15 1. die Verwendung einer Zeigerstruktur , die ahnlich 
der Verbindungsstruktur in Dateisystemen fur klas- 
sische Speicliermedien (wie z. B. Festplatten und 
Disketten) arbeitet, oder 
2. die Verwendung eines virtuellen Adressraums, der 

20 ahnlich eines virtuellen Adressraxims in Rechnern 

verwaltet wird. 

Wir werden uns im Folgenden auf den zweiten Punkt 
beschranken und annehmen, die Daten eines Festplatten- 
2S systems werden in Form eines virtuellen Adressraums 
gleichgroEer Datenbl5cke verwaltet. Das Problem besteht 
also darin, eine ■ geeignete Abbildung des virtuellen 
Adressraums auf die Festplatten zu finden. 

3 0 Die einfachste Art der Abbildung ist das so genannte 
Disk-Striping [CPKSS] , das in vielen Ansatzen in 
unterschiedlicher Granularitat verwendet wird [PGK88, 
TPBG93 , BBBM94 , BHiyiM93 , HG92 , BGMJ94 , BGM95] . Diese 
Methode hat eine weite Verbreitung in 
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Festplattenf eldern (auch als RAID- Arrays [RAID = 
Redundant Array of Independent Disks] bezeichnet) 
erfahren, da viele der optionalen Platzierungsmethoden 
(genannt: RAID-Level) auf Disk-Striping aufbauen. Beim 
5 Disk-Striping werden die Datenblocke des virtuellen 
Adressraums (oder Teilblocke dieser Datenbl5cke) zyk- 
lisch urn die Festplatten gewickelt. Diese Strategie hat 
den Nachteil, dass sie sehr unflexibel beztiglich einer 
sich andernden Anzahl an Festplatten ist. Eine Ver- 

10 anderung urn lediglich eine Festplatte kann eine fast 
vollstandige Neuverteilung der Datenblocke erfordern. 
Aus diesem Grund sind heutige Festplattenf elder nur 
schlecht skalierbar. Ublicherweise werden daher Fest- 
plattensysteme mit sehr vielen Festplatten in mehrere 

15 RAID-Arrays untergliedert . 

Die Verwendung von zufalligen Datenplatzierungen 
(mittels pseudo-zufalliger Funktionen) ist bereits von 
vielen Forschern als vielversprechende Alternativ- 

2 0 methode angesehen worden [AT97, B97, SMB98, K97] . In 

dieser Technik werden den Datenblocken zuf^llig aus- 
gewahlte Festplatten zugewiesen. Zu den erst en, die 
zufallige Datenplatzierungsstrategien untersucht haben, 
zahlen Mehlhorn und Vishkin [MV83] . Insbesondere haben 
25 sie untersucht, inwiefern mehrere zufallig platzierte 
Kopien pro Datenblock helfen konnen, um Anfragen 
gleichmaSig auf die Speichereinheiten zu verteilen. 
Weitere wichtige Resultate in dieser Richtung sind 
z. B. von Upfal and Wigderson [UW87] und Karp, Luby und 

3 0 Meyer auf der Heide [KLM92] erzielt worden. 



Birk [B97] hat ahnliche Datenabbildungs- und -zugriffs- 
strategien verges chlagen, aber er verwendet eine 
Paritatskodierung der Datenblocke. 



wo 2004/021214 



PCT/EP2003/008635 



9 



^eitere Arbeiten sind unter anderem von Santos und 
Muntz im Rahmen des RIO Datenserver-Projekts (RIO = 
Remote I/O) durchgefuhrt worden [SMB98, SM98] . Sie 
5 vergleichen die zufallige Platzierung mit traditionel- 
len Striping-Methoden und zeigen, dass selbst in 
Situationen, fur die Disk-Striping entwickelt worden 
ist (regulare Zugrif f smuster ) , die zufallige Platzie- 
rung gleichwertig oder besser ist [SM98b] . Ihre zuf al- . 

10 lige Platzierung basiert auf einem zufalligen Muster 
fester GroiSe. Falls die Anzahl der Datenblocke diese 
GroEe libersteigt, dann wenden sie das Muster wiederholt 
an, urn den gesamten Datenraum auf die Festplatten abzu- 
bilden. Das kann nattirlich zu unangenehmen Korrelatio- 

15 nen zwischen den Datenblocken fxihren und eine Abwei- 
chung von der Gleichverteilung der Datenblocke und An- 
fragen verursachen. 

Bisher gibt es jedoch nur wenige Ansatze, die in der 

2 0 Lage sind, die Anf orderungen an eine effiziente, 

pseudo-randomisierte Datenplatzierung zu erfullen. 
Besonders Schwierigkeiten ergeben sich . dann, wenn 
heterogene, das heifit verschieden groSe Datenspeicher- 
systeme verwendet werden oder wenn Datenspeichersysteme 
25 dynamisch in ein System eingefugt oder aus dem System 
herausgenoramen werden. 

Ein erster Ansatz, urn Datenblocke dynamisch und ran- 
domisiert uber Datenspeichersysteme zu verteilen, ist 

3 0 in [KLL+97] vorgestellt worden. Dort werden (pseudo- 

) zuf allige Funktionen verwendet, urn den Datenblocken 
und Datenspeichersystemen zufallige reelle Punkte im 
Intervall [0,1] zuzuweisen. Ein Datenblock wird immer 
von dem Datenspeichersystem gespeichert, dessen Punkt 
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am nachsten am Punkt des Datenblocks im [0 , 1] -Intervall 
liegt. Der Vorteil dieser Strategie liegt darin, dass 
sie einfach zu verwalten ist und sie nur die 
Replatzierung einer erwartungsgemaS minimalen Aazahl an 
5 Blocken bei einer wechselnden Anzahl an Datenspeicher- 
sysfcemen erfordert. Sie hat allerdings den Nachteil, 
dass relativ hohe Schwankungen um den Erwartungswert 
fiir die Anzahl der auf einexn Datenspeichersystem zu 
speichernden Blocke und der zu replatzierenden Blocke 
10 auftreten konnen und dass sie nur fiir homogene Daten- 
speichersysteme effizient anwendbar ist. 

In [BBS99] wurde ein Verfahren vorgestellt, das auch 
auf (pseudo-) zuf alligen Funktionen aufbaut. Die Daten- 
15 blocke werden wie auch in [KLL+97] mittels einer sol-^ 
Chen Funktion auf zufallige Punkte im [0 , 1] -Interval 1 
abgebildet. Aber die Zuordnung des [0 , 1] -Interval Is auf 
die Datenspeichersysteme geschieht mittels einer fest 
vorgegebenen Abbildung, die Assimilierungs funktion ge- 

2 0 nannt wird. Diese Funktion sorgt dafiir, dass jede Fest- 

platte den gleichen Anteil des [0 , 1] -Intervalls zuge- 
wiesen bekoxnmt. Damit kann gewahrleistet werden, dass 
nicht nur die benutzten Datenblocke des virtuellen 
Adressraums sondern auch Anfragen an diese Blocke 
25 gleichmaJSig liber die Festplatten verteilt werden kon- 
nen. Ein Vorteil dieses Verfahrens im Vergleich zu 
[KIjL+98] liegt darin, dass die Assimilierungsf unktion 
die Daten mit wesentlich geringeren Abweichungen von 
der Gleichverteilung uber die Datenspeichersysteme ver- 

3 0 teilen kann. Wie die Strategie in [KLL+98] benotigt 

diese Strategie nur die Replatzierung einer erwartungs- 
gemaiS minimalen Anzahl an Blocken bei einer wechselnden 
Anzahl an Datenspeichersystemen. Allerdings funktio- 
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niert sie wie die Strategie in [KrjL+98] nur gut fiir 
tiomogene Systeme. 

Da es haufig aus Kostengrunden nicht effizient ist, 
5 dass ein Speicher system rein aus identischen Daten- 
speichersystemen besteht, wurden in [BSSOO] auch 
Strategien fur nichtuni forme Datenspeichersysteme ent- 
worfen. Diese basieren auf der in [BBS99] vorgestellten 
Strategie fur identische Datenspeichersysteme. Zunachst 

10 wird angenommen, alle Systeme haben die gleiche 
Speicherkapazitat . Auf alle die Intervallteile, die 
liber die Kapazitat einer Datenspeichersysteme hinaus- 
gehen, wird dann in einer zweiten Runde noch einmal die 
Strategie ftir identische Festplatten angewandt, aller- 

15 dings diesmal nur auf die Datenspeichersysteme, die 
nach der ersten Platzierungsrunde noch freie Kapazita- 
ten besitzen. Die dabei nicht unterzubringenden Inter- 
vallteile werden in einer weiteren Runde noch einmal 
platziert, usw. , bis das komplette [ 0 , 1] -Intervall 

20 untergebracht ist. Der Hauptnachteil dieses Verfahrens 
besteht darin, dass es Situationen gibt, in denen 
deutlich mehr an Daten umplatziert werden, als minimal 
notwendig . 

25 Die Aufgabe, die durch die Erfindung gelost werden 
soil, besteht darin, ein Verfahren und eine Anordnung 
zur randomisierten Datenspeicherung in Speichernetzwer- 
ken und/ Oder einem Intranet und/oder dem Internet sowie 
ein entsprechendes Computerprogramm-Erzeugnis und ein 

3 0 entsprechendes computerlesbares Speichermedium bereit- 
zustellen, durch welche die vorstehend genannten Nach- 
teile behoben werden und insbesondere eine effektive 
Behandlung von Speichernetzwerken, die heterogene 
Speichermedien umfassen, sowie eine dynamische 
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Skalierung von Speichernetzwerken durch Einfiigen oder 
Herausnehitien von Speichermedien gewahrleistet wird. 

Diese Aufgabe wird erf indungsgemafi gelost durch die 
Merkmale im kennzeichnenden Tail der Anspriiche 1, 15, 
23 und 2 4 im Zusammenwirken mit den Merkmalen im Ober- 
begriff . ZweckmaSige Ausgestaltungen der Erfindung sind 
in den Unteranspriichen en thai ten. 

Ein besonderer Vorteil der Erfindung liegt darin, dass 
durch das Verfahren zur randomisierten Datenspeicherung 
in Speichernetzwerken und/ oder einem Intranet und/ oder 
dem Internet die Behandlung von Anderungen im Speicher- 
netzwerk ganz erheblich vereinfacht wird, indem eine 
Menge von Datenblocken Di (i=l/ ni) einer Menge von 

Datenspeichersystemen Sj (j=l/ .../ n) gemaS den 
folgenden Schritten zugeordnet und dort gespeichert 
wird: 

a) der Gesamtmenge der Datenspeichersysteme wird ein 
virtueller Speicherraum und jedem einzelnen Daten- 
speichersystem Sj (j=l, n) durch einen ersten 
Zuf allsprozeS mindestens ein Teilraum Ij des vir- 
tuellen Speicherraums zugeordnet, wobei das Ver- 
haltnis zwischen dem Teilraum Ij und dem gesamten 
virtuellen Speicherraum wenigstens naherungsweise 
dem Verhaltnis der auf das Datenspeichersystem Sj 
bzw. auf die Gesamtmenge der Datenspeichersysteme 
bezogenen Werte eines vorgebbaren Parameters 
entspricht , 

b) jedem Datenblock Di {i=l, m) wird durch einen 
zweiten Zuf allsprozeS ein (zufalliges) Element h(i) 
des virtuellen Speicherraums zugeordnet, 

c) fiir jeden Datenblock Di (i=l, m) wird minde- 
stens ein Teilraum Ik ermittelt, in dem h(i) ent- 
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halten ist, und der Datenblock Di mindestens einem 
der durch diese(n) Teilraume (Teilraum) Ik repra- 
sentierten Datenspeichersystem Sk zugeordnet und 
dort gespeichert. 

5 

Eine Anordnung zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/oder dem 
Internet ist vorteilhaf terweise so eingerichtet , dajS 
sie mindestens einen Prozessor umfaiSt, der (die) derart 

10 eingerichtet ist (sind) , daS ein Verfahren zur 
randomisierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet durch- 
fuhrbar ist, wobei die randomisierte Datenspeicherung 
die Verf ahrensschritte gemafi einem der Anspruche 1 bis 

15 14 umfafit. 

Ein Computerprograramprodukt zur randomisierten Daten- 
speicherung in Speichernetzwerken und/oder einem Intra- 
net und/oder dem Internet umfaKt ein computerlesbares 

2 0 Speichermedium, auf dem ein Programm gespeichert ist, 

das es einem Computer ermoglicht, nachdem es in den 
Speicher des Computers geladen worden ist, ein Ver- 
fahren zur randomisierten Datenspeicherung in Speicher- 
netzwerken und/oder einem Intranet und/oder dem Inter- 
25 net durchzuf iihren, wobei die randomisierte Datenspei- 
cherung die Verf ahrensschritte gemaS einem der An- 
sprtiche 1 bis 14 umfafit. 

Urn eine randomisierte Datenspeicherung in Speichernetz- 

3 0 werken und/oder einem Intranet und/oder dem Internet 

durchzuf iihren, wird vorteilhaf teirweise ein computerles- 
bares Speichermedium eingesetzt, auf dem ein Programm 
gespeichert ist, das es einem Computer ermoglicht, 
nachdem es in den Speicher des Computers geladen worden 
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ist, ein Verfahren zur random! sier ten Datenspeicherung 
in Speichernetzwerken und/oder einem Intranet und/oder 
dem Internet dur chzuf uhr en , wobei die randomisierte 
Datenspeicherung die Verf ahrensschritte gemafi einem der 
5 Ansprtiche 1 bis 14 umfafit. 

In einer bevorzugten Ausf uhrungsf orm des erfindungs- 
gemaSen Verfahrens ist vorgesehen, dass bei dem ersten 
und/oder zweiten Zuf allsprozeE pseudo-zuf allige 
10 Funktionen angewendet werden. 

Als ein weiterer Vorteil erweist es sich., wenn Daten- 
speichersysteme S j , deren Wert Cj des vorgebbaren Para- 
meters einen ebenfalls vorgebbaren zweiten Wert 8 liber- 

neue virtuelle Datenspeichersysteme Sj- 



steigt, in 



6 7^ 0 - in ein 



15 mit Cj. =5 und - falls Cj - . 

weiteres virtuelles Datenspeicher system Sk mit Ck = Cj - 
c ' 

^ * 5 zerlegt werden und diesen virtuellen Daten- 

speichersystemen durch den ersten Zuf allsprozeS jeweils 
mindestens ein Teilraum Ij' bzw. Ik des virtuellen 

2 0 Speicherraums zugeordnet wird, wobei \a\ den ganzzah- 

ligen Anteil einer Zahl a e 3 beschreibt. 
Des weiteren ist es von Vorteil, wenn der virtuelle 
Speicberraum durch das Intervall [0,1) und die Teil- 
raume Ij durch mindestens ein in [0,1) enthaltenes 
25 Teilintervall reprasentiert werden und im ersten Zu- 
fallsprozeK durch die Anwendung einer ersten Hash- 
Funktion g(j) der linke Rand des Intervalls Ij ermit- 
telt und die Lange des Intervalls gemaS (g(j) + s Cj) 
berechnet wird, mit: 

3 0 Cji Wert des auf das Datenspeichersystem Sj bezogenen 

Parameters und 
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s: Stretch-Faktor, der so gewahlt ist, daS s * < 1 
erfullt ist. 

Von Vorteil ist es dabei, wenn der Stretch-Faktor s 
derart gewahlt wird, dass das Intervall [0,1) vollstan- 
5 dig durch die Teilintervalle Ij uberdeckt wird. 

Im zweiten Zuf allsprozeS wird vorteilhaf terweise durch 
die Anwendung einer zweiten Hash-Funktion h(i) jedem 
Datenblock Di (i=l, m) eine Zahl h(i) e [0,1) 

zugeordnet . 

10 In einer bevorzugten Ausfiihrungsf orm des Verfahrens zur 
randomisierten Datenspeicherung ist vorgesehen, dass 
der vorgebbare Parameter die physikalische Kapazitat 
von Datenspeichersystemen oder die Anfragelast von 
Datenspeichersystemen beschreibt oder Abweichungen von 

15 der gewiinschten Verteilung korrigieren. 

In deiti Fall, dass das einem Datenblock Di zugeordnete 
Element h(i) in mehreren TeilrSumen Ij enthalten ist, 
erweist es sich als vorteilhaf t, dass eine uniforme 
Platzierungsstrategie angewendet wird, um den Daten- 

20 block Di einem der durch die Teilraume Ij reprasen- 
tierten Datenspeichersystem zuzuordnen. 

Daruber hinaus ist es von Vorteil, dass bei Anderungen 
mindestens eines der Werte C=(ci, cj des vorgeb- 

baren Parameters eine erneute Zuordnung der Datenblocke 
25 Di zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gemaS einem der An- 
spriiche 1 bis 9 unter Zugrundelegung der neuen Para- 
meterwerte C'=(ci^, Cn^) erfolgt. 

In bestiramten Fallen kann es nutzlich sein, bei nur 
3 0 geringen Anderungen von Werten des vorgebbaren Para- 
meters keine Neuverteilung der Datenbl5cke vorzunehmen. 
Dies wird erreicht, indem bei Anderungen mindestens 
eines der Werte C=(ci, Cn) des vorgebbaren Para- 

meters eine erneute Zuordnung der Datenblocke Di zu den 
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Datenspeichersystemen Sj nach dem Verfahren zur rando- 
misierten Datenspeicherung gemaK einem der Anspriiclie 1 
bis 9 unter Zugrundelegung der neuen Parameterwerte 
C^=(ci', Cn') nur erfolgt, wenn ein neuen Para- 

5 meterwert sich von dem entsprechenden aktuellen 

Parameterwert ci um einen vorgebbaren Wert fl unter- 
scheidet . 

Bei groSen Anderungen des vorgebbaren Parameters 
wiederum werden Anpassungen des Systems vorteilhaf ter- 

10 weise vorgenoramen, indem bei Anderungen mindestens 
eines der Werte C=(ci, Cn) des vorgebbaren 

Parameters in einen neuen Parameterwert C'=(cx^, 
Cn^) stufenweise eine ^erneute Zuordnung der Datenblocke 
Di zu den Datenspeichersystemen Sj nach. dem Verfahren 

15 zur randomisierten Datenspeicherung gemaS einem der 
Anspruche 1 bis 9 erfolgt, wobei in jeder Stufe k 
Zwischen-Parameterwerte d^={c^±, .... c^n) itiiit \c± - c^i/ 
< jc± - c'ij (1 = Ijr n) zugrundegelegt werden. 

Dieses Vorgehen hat den groKen Vorteil, dass das System 

2 0 im Gegensatz zu einem direkten Update wesentlich 

schneller auf hohe Anf ragebelastungen oder eine neue, 
vom Administrator gewahlte Kapazitatsverteilung C ' 
reagieren kann, da in jedem der Ubergangsprozess von 
C nach C * abgebrochen werden kann . 
25 Dariiber hinaus ist es von Vorteil, dass zur 
Abspeicherung der Datenblocke in einem Speichermedium 
mindestens eine Tabelle bereitgestellt wird, in denen 
die Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf dem Speichermedium abge- 

3 0 speichert ist. 

Ein weiterer Vorteil des erf indungsgemaiSen Verfahrens 
zur randomisierten Datenspeicherung besteht darin, dass 
mehrere Datenblocke zu einem Extent zusammengef asst 
werden, denen in der Tabelle eine gemeinsame physika- 
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lische Adresse auf dem Speicheirmediiim zugeordnet wird, 
wobei die Datenblocke eines Extents im logischen 
Adressraum miteinander verbunden sind, indem der erste 
Datenblock eines aus 2^ Datenblocken bestehenden 
5 Extents eine Adresse der Form x00...000 erhalt, wobei 
die unteren A Bits Null sind, der letzte Block dieses 
Extents die Adresse erhalt, wobei die unter- 

sten A Bits Bins sind, und die physikalische Position 
eines Datenblocks durch eine Addition des Tabellen- 
10 eintrags fiir den zugehorigen Extent mit den letzten X 
Bits der logischen Adresse des Datenblocks gewonnen 
wird. Durch dieses Vorgehen wird die Anzahl von zu 
sichernden Tabelleneintragen reduziert. 

15 In einer bevorzugten Aus fuhrungs form der Erfindung ist 
vorgesehen, dass die Anordnung mindestens einem Daten- 
speichersystem und/oder mindestens einem Computer- 
system, das (die) lesend und/oder schreibend auf die 
Speichermedien zugreift (zugreifen) , und/oder minde- 

20 stens eine zwischen das (die) Computersystem (e) und das 
(die) Datenspeichersystem(e) geschaltete Kontroller- 
Einheit zur Steuerung des Verfahrens randomisierten 
Datenspeicherung umfasst. Die Datenspeichersysteme 
umfassen dabei vorteilhaf terweise Festplattenf elder 

25 und/oder als Web-Cashes ausgebildete Zwischenspeicher 

Weiterhin stellt es sich als vorteilhaf t heraus, wenn 
die Anordnung mindestens eine zwischen das (die) Com- 
putersystem ( e) und das (die) Datenspeichersystem(e) ge- 
schaltete Kontroller-Einheit zur Steuerung des Ver- 

3 0 fahrens zur randomisierten Datenspeicherung umfasst. 
Dabei kann es sich als niitzlich erweisen, dass das Ver- 
fahren zur randomisierten Datenspeicherung als Hard- 
ware-RAID-Verf ahren in der Kontroller-Einheit implemen- 
tiert ist. 
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In einer welter en bevorzugten Ausfuhrungsf orm der Er~ 
findung ist vorgesehen, dass die Anordnung mindestens 
ein dediziertes, liber Mittel ziim Datenaustausch mit 
Speichermedien und Computersystemen der Anordnung ver- 
5 bundenes Computer system (SAN-Appliance) zur Koordina- 
tion der Datenspeicherung und/oder tiber Mittel zum 
Datenaustausch mit Speichermedien und Computersystemen 
der Anordnung verbundene Rechenressourcen (In-Band- 
Appliances) zur Verteilung der Datenblocke umfasst. 
10 Ebenso stall t es einen Vorteil dar, dass die Anordnung 
heterogene Speichermedien umfasst. 

Die Erfindung soli nachstehend anhand von zumindest 
teilweise in den Figuren dargestellten Ausfiihrungs- 
15 beispielen naher erlautert werden. 

Es zeigen: 

Fig. 1 Aufbau eines Speichernetzwerkes , 
Fig. 2 Veranschauli Chung der Out-of-Band Virtuali- 

sierung des Datenraums, 
Fig. 3 Veranschauli Chung der In-Band Virtuali- 
sierung. 

Fig. 4 Aufteilung der virtuellen Adresse eines 
Datenblocks zur Bestimmung der zugehorigen 
Festplatte und des zugehorigen Metablocks . 

Wie aus dem Anf orderungsprof il an die Datenverwaltungs- 
strategie ersichtlich wird, ist die Losung der Aufga- 
30 benstellung im Allgemeinen davon abhangig, ob die an 
ein System angeschlossenen Clients 3 uber alle ftir die 
Datenverteilung notwendigen Inf ormationen verfiigen. Im 
Folgenden wird das erf indungsgemafie Verfahren, welches 
nachfolgend als Share-Strategie bezeichnet wird. 



20 



25 
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verges tellt, welches in der Lage ist, in beiden Fallen 
nahezu optimale Verteilungs- und Zugrif f seigenschaf ten 
zu garantieren. 

5 Nachfolgend werden kurz Voraussetzungen und Definition 
nen vorgestellt, die bei der Beschreibung des Ausfiih- 
rungsbei spiels benutzt werden. 

Die Anzahl der in einem System zu speichernden Daten- 
10 blocke wird mit jh, die Anzahl der maximal verwendbaren 
Datenspeichersysteme mit N bezeichnet. N wird dabei 
durch die Datenplatzierungsstrategie vorgegeben und ist 
nicht von der aktuellen Anzahl und GroSe der Daten- 
speichersysteme abhangig. Die Anzahl der in dem System 
15 tatsachlich verfugbaren Datenspeichersysteme wird mit n 
bezeichnet. Fiir den Fall, dass die Anzahl der von den 
Datenspeichersystemen speicherbaren Datenblocke kleiner 
als m 1st, ist es erf orderlich, dass ein weiteres Spei- 
chersystem zur Verfugung gestellt wird, in das aktuell 
20 nicht abbildbare Datenbl5cke ausgelagert werden konnen. 

Der Anteil der Datenblocke, die von einem Datenspei- 
chersystem i gespeichert werden konnen, wird als rela- 
tive Kapazita.t Ci G [0,1] bezeichnet, wobei Ei ci = 1 . 

25 Die GroBe der individuellen ci kann dabei von verschie- 
denen Faktoren abhangen, so z. B. von der Speicher- 
kapazitat, wenn es sich urn eine Festplatte handelt, 
Oder von der Bandbreite der angeschlossenen Verbin- 
dungen bei einem Web-Cache. Zielsetzung einer Daten- 

3 0 platzierungsstrategie sollte es sein, dass auf jedem 
Da tenspeicher system i bei m zu platzierenden Daten- 
blocken Ci * 212 Datenblocke gespeichert werden. Bei der 
Beschreibung der umzusetzenden Techniken wird nicht 
davon ausgegangen, dass sich die Anzahl der Datenspei- 
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chersysterae in dem System verandert. Diese Situation 
kann dadurch modelliert werden, dass die relative 
Kapazitat Ci eines Datenspeichersystems i, das sich zuiri 
Zeitpunkt t nicht in dem System befindet, zu diesem 
5 Zeitpunkt auf Null gesetzt wird. 

Die Aufgabe der Datenverteilungsstrategie kann nun in 
zwei Aufgabenpunkte untergliedert werden. In einem er- 
sten Schritt muss ein Datenblock mit seiner virtuellen 

10 Adresse einem Datenspeichersystem zugeordnet werden. 
Diese Zuordnung wird im Folgenden auch als glohale 
Datenverteilung bezeichnet. In einem zweiten Schritt 
muss der Datenblock nicht nur einem Datenspeicher- 
system, sondern zusatzlich auch einer Position auf 

15 diesem Datenspeichersystem zugeordnet werden. Diese Zu- 
ordnung wird im Folgenden auch als lokale Daten- 
verteilung bezeichnet. Die Erfindung beschaftigt sich 
mit dem Problem der globalen Datenverteilung. Im Rahmen 
der Beschreibung des erf indungsgemaSen Verfahrens wer- 

2 0 den kurz einfache lokale Datenverteilungsstrategien 
vorgestellt, die unsere neuen globalen Datenvertei- 
lungsstrategien erganzen. 

Eine Voraussetzung fur den Einsatz der Share-Strategie 
25 ist es, dass sie als Subroutine eine Funktion verwenden 
kann, die das Problem der Datenverteilung fur uniforme 
Datenspeichersysteme lost, d. h. fur den Fall, dass Ci 



= y fur alle i. Mogliche Strategien fur den uniformen 
/n 



Fall sind in [KLIi+97] und [BBSOO] verges tellt worden. 



Die Share-Strategie wird nun im Detail beschrieben: In 
Share werden jedem Speichersystem ein oder mehrere 
Intervalle zugeordnet, deren GesamtgroEe der relativen 
Kapazitat des Systems entspricht. Diese Intervalle 
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warden auf ein [0, 1) -Intervall abgebildet, konnen sich 
aber im Gegensatz zu friiheren Strategien mit anderen 
Intervallen -Qberlappen. Jedem Datenblock wird nun 
mittels einer (pseudo- ) zuf alligen Funktion ein reeller 
5 Punkt im [ 0 , 1) -Interval 1 zugewiesen. Dieser Punkt kann 
eventuell zu mehreren Intervallen von Speichersystemen 
gehoren. Falls dem so ist, wird eine uniforme 
Platzierungsstrategie verwendet, um den Datenblock 
einem dieser Speichersysteme zuzuweisen. Verandern sich 
10 nun die relativen Kapazitaten der Speichersysteme, so 
werden die Interval llangen entsprechend angepasst. 

Im Folgenden werden wir zunachst eine detaillierte Be- 
schreibung der Share-Strategie geben und anschliefiend 
15 darlegen, warum sie anderen Strategien tiberlegen ist. 

Die von der Share-Strategie verwendete Strategie fur 
uniforme Datenspeichersysteme wird im Folgenden als 
Uniform(b,S) bezeichnet, wobei h die virtuelle Adresse 

2 0 des Datenblocks und S die Menge der Datenspeicher- 

systeme beschreibt. Die Rackgabe der Funktion liefert 
das Datenspeichersystem, auf das der Datenblock b 
platziert wird. 

25 Die Share-Strategie basiert auf zwei zusatzlichen Hash- 
Funktionen, die neben den moglicherweise fur die uni- 
forme Strategie verwendeten Hash-Funktionen bereitge- 
stellt werden miissen. Die Hash-Funktion h: 
{1,...,M} — > [0,1) verteilt die Datenblocke pseudo- 

3 0 zufallig uber das Intervall [0,1). Eine weitere Hash- 

Funktion g: {1,..., N} [0,1) ordnet den beteiligten 

Datenspeichersystemen einen Punkt in dem Intervall 
[0,1) zu. Weiterhin werden die Parameter S ^ [1/JV, 1] 
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verwendet^ deren Bedeutung im weiteren Verlauf 
erlautert wird. 

Es wird angenommen, dass n Datenspeichersysteme mit 
(ci,...,Cn) e [0,1)^ gegeben sind. Es wird dann die 
folgende Strategie verwendet: Fur jedes Datenspeicher- 



system mit ci > 5 werden 



neue virtuelle Datenspei- 



chersysteme i' mit ci- =5 eingef iigt . Entspricht die 
Summe der relativen Kapazitaten der virtuellen Daten- 
10 speichersysteme nicht der ursprunglichen Kapazitat, 
wird ein zusatzliches virtuelles Datenspeichersystem j 

mit Cj = Ci - eingefiigt. Datenspeichersysteme, 

deren Demand kleiner als S sind, werden in ihrer 
urspranglichen Form belassen und als einzelne, vir- 
15 tuelle Datenspeichersysteme angesehen. Durch die 
Transformation der Datenspeichersysteme werden maximal 
n' < n + 1/6 virtuelle Datenspeichersysteme erzeugt. 

Jedem virtuellen Datenspeichersystem i wird nun ein 
20 Intervall X± der Lange s ^ Ci zugeordnet, das von g-(i) 
bis + s CiModl reicht. Der [0 , 1) -Bereich wird 

also als Ring angesehen, urn den die einzelnen Inter- 
valle gewickelt werden. Die Konstante s wird als 
Stretch-Faktor bezeichnet. Um zu verhindern, dass ein 
25 einzelnes Intervall mehrfach um den Ring gewickelt 
wird, sollte 5 < gewahlt werden. Ein 5 > ^ ist 

moglich, erschwert jedoch die Umsetzung des Verfahrens. 

Fur jedes e [0,1) sei Cy: = {i: g I±} die Menge der 

3 0 Intervalle, in denen x enthalten ist. Die Anzahl der 

Elemente Cx = I Cxi in dieser Menge wird als Contention 

bezeichnet. Da die Anzahl der Endpunkte der Intervalle 
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der virtue! len Datenspeichersysteme maximal 

2n' < 2 (n + ^) betr^gt, wird das [0 , 1) -Interval 1 in 

maximal 2 (n + ^) Rahmen Fj e [0,1) aufgeteilt, so 

dass fur jeden Rahmen Fj die Mange Cx fur jedes x s Fj 
5 identisch ist. Die Beschrankung der Anzahl der Rahmen 
ist wichtig, um die Grofie der Datenstrukturen fiir die 
Share-Strategie zu begrenzen. 

Die Berechnung des zu einem Datenblock zugehorigen 
10 Datenspeicher systems erfolgt nun durch den Auf ruf : 
Uniform(b, Ch{b) ) • 

Ein wichtiger Vorteil der Erf indung besteht wie erwahnt 
darin, daJS sie die Behandlung von Anderungen im Spei- 
15 chernetzwerk 1 in M.ufierst einfacher Weise gestattet. Je 
nach Anforderung kann es sich dabei als sinnvoll 
erweisen, auf sich andernde Umgebungen mit einer 
Adaption der Share-Strategie zu reagieren. 

2 0 Bisher wurde erlautert, wie die Platzierung von Daten- 
blocken in einem statischen System vorzunehmen ist. Es 
wird nun angenommen, dass sich die Verteilung der 
relativen Kapazitaten in dem System von C=(ci, Cn) 
auf C'=(ci', Cn ) verandert. Wie oben erlautert, 

25 umfasst dieses auch den Fall, dass neue Datenspeicher- 
systeme in das System eintreten, bzw. Datenspeicher- 
systeme das System verlassen. Es sind nun verschiedene 
Varianten denkbar, um einen Ubergang von C nach C 
vorzunehmen . 

30 

Variante 1: Direct Update 

Die einfachste Methode besteht darin, direkt von C nach 
C* uberzugehen und die entsprechenden Umplatzierungen 
vorzunehmen. Das hat den Nachteil, dass selbst bei 
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kleinsten Veranderungen wegen der Verwendung pseudo- 
zufalliger Funktionen eventuell Umplatzierungen von 
mehreren Datenbl6cken vorgenommen werden miissen, und 
bei groSen Veranderungen das System sich lange in einem 
5 Ubergangszustand befindet, was die Auf rechterhaltung 
des oben genannten vierten Punktes der 2\nf orderungen an 
Datenverwaltungsstrategien gefahrden kann. 

Variante 2 : Lazy Update 
10 Im Folgenden wird eine Strategie vorgestellt, die dafur 
sorgt, dass bei sehr geringen Kapazi tats veranderungen 
keine Daten umzuverteilen sind. 

Sei 0 < |JL < 1 eine feste Konstante, die als Trag-heit 
15 der Share-Strategie bezeichnet wird. Die Share- 
Strategie andert die relative Kapazitat eines 
Datenspeichersystems i nur dann von ci auf Ci ' , wenn 
Ci' ^ (1 + |X)Ci Oder ci' < (1 - |UL)Ci. Hierdurch. kann die 
Summe der relativen Kapazitaten tiber alle 

2 0 Datenspeichersysteme von 1 abweichen, bleibt jedoch im 

Bereich von 1 ± |Ll, so dass bei kleinem |LL die 
Eigenschaf ten der Share-Strategie nicht gefahrdet sind. 

Variante 3 : Smooth Update 
25 Diese Variante ist sinnvoll fiir den Fall groSer Kapazi- 
tatsanderungen. Falls C und C grofie Kapazitats- 
abweichungen haben, werden zunachst Zwischenstuf en 
Ci, C2r C3,...,Ct berechnet, so dass mit C=Co und C ^ =Ct+i 
ftir jedes i in {0,...,t} Ci und Ci+i eng genug beisammen 

3 0 liegen, dass es dem System moglich ist, schnell von der 

einen zur anderen Kapazi tatsverteilung und damit in 
einen stabilen Zustand uberzugehen. Dieser Prozess hat 
den groSen Vorteil, dass das System im Gegensatz zum 
Direct Update wesentlich schneller auf hohe 
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Anf ragebelastungen oder eine neu vom Administrator 
gewahlte Kapazitatsverteilung C ' reagieren kann, da in 
jedem Ci der Ubergangsprozess von C nach C abgebrochen 
warden- kann. 

5 

Konkrete Umsetzungen der Verfahren werden in der 
weiteren Beschreibung erlautert. 

Wahl der Kapazitaten: 

10 

Die Wahl der Kapazitaten fiir Share muss sich nicht not- 
wendigerweise nach der physikalischen Kapazitat eines 
Speichersystems richten. Da Share beliebige Kapazitats- 
verteilungen zulasst, k5nnen die Share-Kapazitaten auch 

15 dazu benutzt werden, urn eine bessere Balancierung der 
Anfragelast vorzunehmen, um zum Beispiel Engpasse in 
den Verbindungen zu Speichersystemen oder in den 
Speichersystemen selbst zu beseitigen. Des Weiteren 
konnen sie benutzt werden, um Abweichungen von der 

2 0 gewiinschten Verteilung (die wegen der Verwendung 
pseudo-zuf alliger Hash-Funktionen nicht auszuschlieKen 
sind) auszugleichen. Die Share Strategie erlaubt also 
eine hohe Flexibilitat in der Verteilung der Daten und 
eine hohe Robustheit, und erfiillt damit wichtige 

25 Anf orderungen an ein Speichersystem. 

Nachfolgend werden noch einige spezielle Aspekte des 
erf indungsgema&en Verfahrens erlautert: 

30 1. Abdeckung des [0 , 1) -Interval Is 

Damit sichergestellt werden kann, dass die Share- 
Strategie jedem Datenpunkt ein Datenspeicher system zu- 
weisen kann, muss das [0 , 1) -Intervall vollstandig durch 
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die Intervalle der virtuellen Datenspeichersysteme ab- 
gedeckt warden. Dieses kann bereits durch die Hash- 
Funktion g sichergestellt sein, indem nach der Vertei- 
lung der Intervalle der Datenspeichersysteme die Ab- 
5 deckung tiberpruft wird und gegebenenf alls einzelne 
Intervalle verschoben werden. Bei einer zufalligen 
Platzierung der Intervalle durch eine pseudo-randomi- 
sierte Hash-Funktion h ist es jedoch ausreichend, einen 
Stretch-Faktor s = ^ In 22 mit Jc > 3 zu verwenden, so 
10 dass mit hoher Wahrscheinlichkeit die Intervalle der 
Datenspeicher Systeme das [0,1) -Intervall abdecken . 
Hohe Wahrscheinlichkeit bedeutet hier, dass die 
Wahrscheinlichkeit, dass ein Bereich nicht abgedeckt 
wird, kleiner als j/ ist. Ergibt die Kontrolle der 

15 Verteilung der Intervalle, dass nicht jeder Punkt des 
[ 0 , 1) -Intervalls abgedeckt ist, so kann die Abdeckung 
durch eine Adaption des Stretch-Faktors erfolgen. 

2 . Benotigter Speicherplatz und Rechenkomplexitat 

20 

Wird die in [KLL+97] verges tellte Strategie als 
homogene Datenplatzierungsstrategie Uniform (b, S) 

verwendet, so liegt die erwartete Zeit, das zu einem 
Datenblock zugehorige Datenspeichersystem zu berechnen, 
25 in 0(1). Die Speicherkomplexitat zur Berechnung der 
Share-Strategie liegt in O^^ * Jc * (n + Yg ) ) . Nicht 

mitgezahlt sind hier die Speicher- und Berechnungs- 
komplexitat der verwendeten Hash-Funktionen. 

3 0 3. Giite der Verteilung 

Werden pseudo-randomisierte Hash-Funktionen verwendet 
und wird ein Stretch-Faktor s > S ln(I\7'/a^) mit 
a - «&/(l + s) gewahlt, so bewegt sich der Anteil der 
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Datenblocke, die von einem Datenspeichersystems i 
gespeichert werden, mit hoher Wahrscheinlichkeit in dem 
Bereich Si g [ (1 - £)d±, (1 - e)di]. 

5 In den folgenden Abschnitten wird dargestellt, wie der 
Aufbau von Datenspeichersystemen mit Hilfe der Share- 
Strategie effizient durchgef uhrt werden kann. Es wird 
darauf hingewiesen, dass es sich dabei lediglich. um 
Implementierungsbeispiele handelt. In einem ersten 
10 Schritt wird vorgestellt, wie die Funktionalitat in ein 
allgemeines RAID-System integriert werden kann: 

Integration der Share-Strategie in ein allgemeines 
RAID- System: 

15 

Die Share-Strategie kann verwendet werden, um in 
Systemen, die aus einer Menge von Speichermedien, aus 
mehreren Computer systemen und einer Kontroller-Einheit 
bestehen, Festplattenf elder aufzubauen, Dabei kann die 
0 Share-Strategie sowohl in dem angeschlossenen Computer- 
systemen als Software-RAID Verfahren integriert werden, 
als auch in der Kontroller-Einheit als Hardware-RAID 
Verfahren. Die Share-Strategie ist dabei fur die Zuord- 
nung der Datenblocke iiber die Festplatten zustandig, 
5 die Zuordnung des Datenblocks zu einer physikalischen 
Adresse auf der Festplatte wird von einer unter der 
Share-Strategie liegenden Strategie ubernommen. Eine 
Moglichkeit fur die Zuordnung der physikalischen Posi- 
tion besteht in der Bereitstellung von Tabellen, in 
0 denen eine Zuordnung zwischen virtueller Adresse und 
physikalischer Adresse auf der Festplatte abgespeichert 
wird. 
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Es ist dabei moglich, die Anzahl der zu sichernden 
Tabelleneintrage zu reduzieren, indem nicht jedem 
einzelnen Datenblock ein eigener Eintrag zugeordnet 
wird/ sondern indem Blockmengen minimaler GroSe, im 
5 Folgenden auch als Extents bezeichnet, uber einen 
gemeinsamen Eintrag in der Tabelle verftigen. Bei einem 
Extent handelt es sich urn eine Menge von Blocken, die 
in dem logischen Adressraum miteinander verbunden sind. 
Ein Extent besteht aus 2^ Blocken. Der erste Block des 

10 Extents hat eine Adresse der Form :kOO...OOO, wobei die 
unteren A Bits 7 durch die Ziffer Null reprasentiert 
sind. Der letzte Block des Extents hat die Adresse 
:k11...111, wobei die untersten A Bits 7 durch die 
Ziffer Eins reprasentiert sind. Die physikalische 

15 Position eines Datenblocks wird durch eine Addition des 
Tabelleneintrags fur den zugehorigen Extent mit den 
unteren X Bits 7 der logischen Adresse des Datenblocks 
gewonnen. Hat jeder Tabelleneintrag die Form yOO.-.OOO, 
d. h. die unteren A Bits 7 werden Null gesetzt, kann 

2 0 die Addition durch eine einfache ODER-Verknupf ung 

durchgefuhrt werden. Die oberen Bits 6 der virtuellen 
Adresse eines Datenblocks dienen also zur Berechnung 
des zugeordneten Speichermediums und der Bestimmung des 
Tabelleneintrages fur den Extent, die unteren Bits 7 
25 dienen als Offset innerhalb des Extents. Allen Daten- 
blocken, die uber gemeinsame obere Bits 6 verftigen, 
wird ein Tabelleneintrag zugeordnet. Dieser Tabel- 
leneintrag kann z. B. an der Stelle gespeichert werden, 
an der auch die Berechnung der Share- Strategie durch- 

3 0 gefiihrt wird. 

Integration der Share- Strategie in ein Speichernetzwerk 1: 
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Die Integration der globalen Datenverteilungsstrategien 
in ein Speichernetzwerk 1 geht von einer Struktur gemaS 
Figur 1 aus - Das Gesamt system besteht aus einer Menge 
von Datei- oder Datenbankservern, im Folgenden als 
5 Computersysteitie bezeichnet, die liber ein Speichernetz- 
werk 1 an Datenspeichersysteme 4 angeschlossen sind. 
Das Speichernetzwerk 1 umfafit weiter eine Menge von 
Switches bzw. Routern 2, die die Zustellung der Daten- 
pakete zwischen koininunizierenden Einheiten sicherstel- 

10 len. Die Computersysteme sind in dem hier vorliegenden 
Kontext als Clients 3 zu betrachten, die von den Daten- 
speichersystemen 4 Blocke lesen, oder auf den Daten- 
speichersystemen 4 Datenblocke schreiben. Mit Hilfe der 
Share-Strategie kann jede beliebige Teilmenge M der an 

15 das Speichernetzwerk 1 angeschlossenen Speichersysteme 
4 wie ein einziger logischer Speicherpool verwaltet 
werden, der tiber einen linearen Adressraum verfugt. Die 
Menge der Speichersysteme 4 kann dabei in mehrere 
kleinere oder einen grofien Speicherpool aufgeteilt 
0 werden, wobei keine der Speichersysteme 4 mehr als 
einem Speicherpool zugeordnet werden sollte. Es wird im 
Folgenden nur der Fall betrachtet, dass das System aus 
einem Speicherpool besteht. 

5 Aus einem Speicherpool konnen mehrere virtuelle Spei- 
chersysteme aufgebaut werden, wobei jedes dieser vir- 
tuellen Speichersysteme gemafi der Share-Strategie ver- 
waltet wird. Besteht ein Speicherpool aus einer 
Teilmenge M der Speichersysteme, so erfolgt der Aufruf 
0 der Share-Strategie ftir die logischen Speichersysteme 
gemaS der gesamten Teilmenge M. Jedem virtuellen Spei- 
chersystem wird eine Speicher-Policy zugeordnet die 
Eigenschaf ten wie physikalische BlockgroSe und Redun- 
danz umfasst. Diese Zuordnung kann separat ftir jedes 
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virtuelle Speichersystem oder einmal fiir den gesamten 
Speicherpool erfolgen. Nachdem Daten auf eine virtuelle 
Festplatte geschrieben wurden, kann die Speicher-Policy 
im Allgemeinen nicht mehr verandert werden. 

5 

Wird von eineiti Computer system auf einen Extent zuge- 
griffen, der bisher von dem Computer system noch nicht 
verwendet wurde und fiir den kein Tabelleneintrag in 
diesem Computer system vorliegt, muss ein neuer Tabel- 
10 leneintrag allokiert werden. Die Allokation kann auf 
zwei Arten erfolgen: 



1. Das Computer system fragt bei einer zentralen In- 
stanz, die tiber globales Wissen uber alle Tabel- 

15 leneintrage verftigt, nach. einem Tabelleneintrag fur 

das Extent, 

2. Auf jedem Speichersystem 4 ist ein Bereich reser- 
viert, der eine Zuordnung zwischen virtueller 
Adresse und physikalischer Adresse vornimmt. Das 

2 0 Computer system sucht zuerst nach der virtuellen 

Adresse des Extents. Falls diese Adresse noch nicht 
reserviert ist, sucht das Computer system nach einer 
noch freien Adresse auf dem Speichersystem 4. 



2 5 Wird die Koordination nicht durch eine zentrale Instanz 

vorgenommen, so muss diese Aufgabe nach Figur 1 von 
einem oder mehreren der angeschlossenen Computersysteme 
ubernommen werden. Weiterhin konnen jedoch auch ein 
Oder mehrere dedizierte Gerate, die als SAN-Appliances 

3 0 5 bezeichnet werden, zur Koordination der Computer- 

systeme gemafi Figur 2 an das Speichernetzwerk 1 ange- 
schlossen werden. Neben der Entlastung der Computer- 
systeme um die Koordination kann durch den Einsatz von 
SAN-Appliances 5 sichergestellt werden, dass alle 
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angeschlossenen Computersysteme die gleiche Sicht auf 
die Speichersysteiiie 4 haben, d. h- zuiti gleichen Zeit- 
punkt liber das Verlassen bzw. Hinzukommen von Speicber- 
systemen 4 informiert werden. 

5 

Die SAN-Appliance 5 bietet somit eine Reihe von 
Schnittstellen, liber die Inf ormationen zwischen dem 
SAN- Appliances 5 und den Client-Rechnern 3 ausgetauscht 
werden konnen. Diese umfassen: 

10 

- Anfrage der Grundkonf iguration von jedem Client 3, 

- Anfrage nach neuen Extents von jedem Client 3, 

- Information der Clients 3 uber Veranderungen der 
Inf rastruktur . 

15 

Das Share-Verf ahren kann auch in so genannte In-Band- 
Appliances integriert werden (siehe Figur 3). Bei den 
In-Band-Appliances handelt es sich urn dedizierte 
Systeme, die eine Transformation der logischen Adresse 

2 0 eines Datenblocks, die sie von den angeschlossenen 
Computersystemen erhalten, in die physikalische Adresse 
vornehmen. Der Einsatz von In-Band-Appliances ist dann 
notwendig, wenn die Funktionalitat der Share-Strategie 
nicht in die Computersysteme direkt integriert werden 

25 kann, da keine Software-Version der Share-Strategie fur 
diese Computersysteme verfiigbar ist oder die Leistung 
der angeschlossenen Computersysteme nicht ausreichend 
grog ist, um die Transformation der logischen Adressen 
in die physikalischen Adressen durchzuf lihren . 

30 

Eine In-Band-Appliance verbal t sich aus Sicht der Spei- 
chersysteme 4 wie ein angeschlossenes Computer system, 
aus der Sicht der an die In- Band- Appliance 
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anges Chios senen Computersysteme wie ein physikalisches 
Speicher system . 

In dem Speichernetzwerk 1 konnen In -Band- Appliances mit 
5 Computersystemen, in denen die Share- Strategie ausge- 
fuhrt wird, gemischt werden. 

Aufbau von Internetsystemen mit Hilfe der Share- 
Strategie : 

10 

Die Problemstellung beim Aufbau von Systemen zur Aus- 
lieferung von Datenob j ekten liber das Internet 
unterscheidet sich von dem Aufbau von Speicher systemen 
in sofern, dass Clients 3 in dem Internet keine globale 

15 Sicht uber alle verftigbaren Web-Server und Web-Caches 
in dem System haben. Soli ein Dat;um von einem Web-Cache 
gelesen werden, um die teilnehmenden Web-Server zu 
entlasten, muss also sichergestellt werden, dass der 
Client 3 mindestens einen zu einem Datenob jekt 

20 gehorenden Web-Cache kennt und das zu lesende Daten- 
ob jekt auch dem richtigen Web-Cache zuordnen kann. 

Diese Aufgabenstellung kann im Allgemeinen nicht gelost 
werden, ohne dass von einem Datenob jekt mehrere Kopien 

25 angelegt werden, die uber die Web-Caches gemail, einer 
vorgegebenen Platzierungsstrategie verteilt warden . 
Werden von einem System von jedem Datenob jekt k Kopien 
gespeichert, so fragt der Client 3 nacheinander oder 
gleichzeitig bei den k Web-Caches nach, von denen er 

3 0 glaubt, dass sie eine Kopie des Datenobjektes spei- 
chern. Halt einer der Web-Caches eine Kopie des Daten- 
objektes, so wird diese Kopie anschliefiend von dem 
Client 3 gelesen. 
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Die Anzahl der notwendigen Kopien, damit ein Client 3 
einem Datenobjekt mindestens einen Web-Cache zuordnet, 
der auch. dieses Datenobjekt speichert, ist von der 
verwendeten Verteilungsstrategie und den relativen 

5 Kapazitaten C = (ci, Cn) der Web-Caches abhangig. 

Weiterhin ist sie von der Sicht V=(vijr Vn) des 

Clients 3 abhangig, das heiE.t von den relativen GroSen 
der Web-Caches, die der Client 3 zu kennen glaubt . Die 
Konsistenz Kv der Sicht eines Clients 3 wird wie folgt 

0 definiert: 



n 

Ky =2^min[v,.,cJ 



Es kann gezeigt werden, dass bei Verwendung der Share- 
5 Strategie die Verwendung von 0(log B) Kopien ausrei- 
chend ist, urn mit einer Wahrscheinlichkeit von groSer 



garantieren zu konnen, das mindestens fur 



als [\~ 
V n) 

ein Datenobjekt der Web-Cache, der von der Share- 
Strategie berechnet wird, fur C und V derselbe ist. 

Die Erfindung ist nicht beschrankt auf die hier darge- 
stellten Ausf lihrungsbeispiele . Vielmehr ist es moglich, 
durch Kombination und Modifikation der genannten Mittel 
und Merkmale weitere Ausf uhrungs variant en zu realisie- 
ren, ohne den Rahmen der Erfindung zu verlassen. 
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Patezi'kanspruch.e 



1. Verfahren zur randomisierten Datenspeicherung in 
5 Speichernetzwerken und/oder einem Intranet und/ 

Oder dem Internet, 

dadurch gekennzeichnet , daS 

eine Menge von Datenblocken Di (i=l, m) einer 

Menge von Datenspeichersysteinen Sj (j=l/ n) 
0 gemafi den folgenden Schritten zugeordnet und dort 

gespeichert wird: 

a) der Gesamtmenge der Datenspeichersysteme wird 
ein virtueller Speiclaerrauia und jedem einzel- 
nen Datenspeichersystem Sj (j=l/ n) durch 

.5 einen ersten Zufallsprozefi mindestens ein 

Teilraum Ij des virtuellen Speicherraums 
zugeordnet, wobei das Verhaltnis zwischen dem 
Teilraum Ij und dem gesamten virtuellen Spei- 
cherraum wenigstens naherungsweise dem Ver~ 

0 haltnis der auf das Datenspeichersystem Sj 

bzw. auf die Gesamtmenge der Datenspeicher- 
systeme bezogenen Werte eines vorgebbaren 
Parameters entspricht , 

b) jedem Datenblock Di {i=l, m) wird durch 
5 einen zweiten Zuf allsprozefi ein (zufalliges) 

Element h{i) des virtuellen Speicherraimis 
zugeordnet , 

c) fur jeden Datenblock Di (i=l, ..-/ m) wird 
mindestens ein Teilraum Ik ermittelt, in dem 

,0 h(i) en thai ten ist, und der Datenblock Di min- 

destens einem der durch diese (n) Teilraume 
(Teilraum) Ik reprasentierten Datenspeicher- 
system Sk zugeordnet und dort gespeichert . 
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Verfahren nach Anspruch 1, 
dadurch gekennzeichnet , da£ 

bei dem ersten und/oder zweiten Zuf allsprozefi 
pseudo-zuf allige Funktionen angewendet werden. 

Verf ahren nach einem der Ansprliche 1 oder 2 , 
dadurch gekennzeichnet , daS 

Datenspeichersysteme S j , deren Wert Cj des vorgeb- 
baren Parameters einen ebenfalls vorgebbaren 



^7 



J 



neue virtuelle 



10 zweiten Wert 5 tibersteigt, in 

Datenspeichersysteme Sj« mit Cj. =8 und - falls 
d 0 - in ein weiteres virtuelles 



Ci - 



^7 



Datenspeichersystem Sk mit Ck = Cj - 

/J 

zerlegt werden und diesen virtuellen Datenspei- 
15 chersystemen durch den ersten ZufallsprozeS je- 

weils mindestens ein Teilraum Ij- bzw. Ik des vir- 
tuellen Speicherraums zugeordnet wird, wobei [a] 

den ganzzahligen Anteil einer Zahl a e 3 be- 
schreibt . 

20 

4. Verf ahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet / daiS 

der virtuelle Speicherraum durch das Intervall 
[0,1) und die Teilraume Ij durch mindestens ein in 
25 [0,1) enthaltenes Teilintervall reprasentiert 

werden . 



5. 



Verf ahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, daiS 
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10 



im ersten Zuf allsprozeS durch die Anwendung einer 
ersten Hash- Funkt ion g(j) der linke Rand des 
Intervalls Ij ermittelt und die Lange des 
Inteirvalls gemaS (g'(j) -h s * Cj) berechnet wird, 
mit : 

Cji Wert des auf das Datenspeichersystem Sj 

bezogenen Parameters und 
s: Stretch-Faktor , der so gewahlt ist, daS 
£f * Cj- < 1 erfiillt ist. 

6. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , dafi 

der Stretch-Faktor s derart gewahlt wird, dass das 
Intervall [0,1) vollstandig durch die Teilinter- 
15 valle Ij liberdeckt wird. 

7 - Verfahren nach einem der vorangehenden Anspriiche , 
dadurch gekennzeichnet , dafi 

im zweiten Zuf allsprozeS durch die Anwendung einer 

2 0 zweiten Hash-Funktion h(i) jedem Datenblock Di 

(i=l, m) eine Zahl h(i) e [0,1) zugeordnet 

wird. 

8. Verfahren nach einem der vorangehenden Anspriiche, 

25 dadurch gekennzeichnet , daS 

der vorgebbare Parameter 

die physikalische Kapazitat von Datenspeicher- 
systemen oder 

die Anfragelast von Datenspeicher systemen be- 

3 0 schreibt oder 

Abweichungen von der gewiinschten Verteilung 
korrigieren. 



wo 2004/021214 



PCT/EP2003/008635 



42 



9. Verfahren nach einem der vorangehenden Anspriiclie, 
dadurch gekennzeichnet , dafi 

in dem Fall, dass das einem Datenblock Di zugeord- 
5 nete Element h(i) in mehreren Teilraumen Ij ent- 

halten ist, eine uniforme Platzierungsstrategie 
angewendet wird, xim den Datenblock Di einem der 
durch die Teilraume Ij reprasentierten Datenspei- 
cher system zuzuordnen - 

10. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , daS 

bei Anderungen mindestens eines der Werte 
C=(cji^ •••/ Cn) des vorgebbaren Parameters eine 
erneute Zuordnung der Datenblocke Di zu den 
Datenspeichersystemen Sj nach dem Verfahren zur 
random! sier ten Datenspeicherung gemaK einem der 
Ansprtiche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C^=(ci', CnO erfolgt. 

11. Verfahren nach einem der vorangehenden Anspruche, 

dadurch gekennzeichnet , daiS 

bei Anderungen mindestens eines der Werte 
C=(cxr -.•/ Cn) des vorgebbaren Parameters eine 
erneute Zuordnung der Datenblocke Di zu den 
Datenspeichersystemen Sj nach dem Verfahren zur 
randomisierten Datenspeicherung gemaS einem der 
Anspruche 1 bis 9 unter Zugrundelegung der neuen 
Parameterwerte C^=(ci'^ Cn') nur erfolgt, wenn 

ein neuen Parameterwert Ci* sich von dem ent- 
sprechenden aktuellen Parameterwert ci um eine 
vorgebbare Konstante |l unterscheidet . 
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12. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , daS 

bei Anderungen mindestens eines der Werte 
5 C=(cij. Cn) des vorgebbaren Parameters in 

einen neuen Parameterwert C'=(cx^, CnO stu- 

fenweise eine erneute Zuordnung der Datenblocke Di 
zu den Datenspeichersystemen Sj nach dem Verfahren 
zur randomisierten Datenspeicherung gemaS einem 
10 der Anspriiche 1 bis 9 erfolgt, wobei in jeder 

Stufe k Zwischen-Parameterwerte C^=(c^x, c^n) 
mit \c± - cr^i/ < fcx - c'ij (1=1, ...,n; zugrun- 
degelegt werden. 

13. Verfahren nach einem der vorangehenden Ansprtiche, 
dadurch gekennzeichnet , daS 

zur Abspeicherung der Datenblocke in einem Spei- 
chermedi-um mindestens eine Tabelle bereitgestellt 
wird, in denen die Zuordnung zwischen virtueller 
Adresse und physikalischer Adresse auf dem Spei- 
chermedium abgespeichert ist. 

14 . Verfahren nach Anspruch 13 , 
dadurch gekennzeichnet , daS 

25 mehrere Datenblocke zu einem Extent zusammen- 

gef asst werden, denen in der Tabelle eine gemein— 
same physikalische Adresse auf dem Speichermedium 
zugeordnet wird, wobei die Datenblocke eines 
Extents im logischen Adressraum miteinander ver- 

3 0 bunden sind, indem der erste Datenblock eines aus 

A, 

2 Datenblocken bestehenden Extents eine Adresse 
der Form xOO,..000 erha.lt, wobei die unteren A 



15 



20 
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Bits durch die Ziffer Null reprasentiert sind, der 
letzte Block dieses Extents die Adresse xll...lll 
BThM.lt, wobei die untersten A Bits durch die Zif- 
fer Eins reprasentiert sind, und die physikalische 
5 Position eines Datenblocks durch eine Addition des 

Tabelleneintrags fur den zugehorigen Extent mit 
den letzten A Bits der logischen Adresse des 
Datenblocks gewonnen wird. 

10 15- Anordnung mit mindestens einen Prozessor, der 
(die) derart eingerichtet ist (sind) , da£ ein Ver- 
fahren zur randomisierten Datenspeicherung in 
Speichernetzwerken und/oder einem Intranet und/ 
Oder dem Internet durchftihrbar ist, wobei die 

15 randomisierte Datenspeicherung die Verfahrens- 

schritte gemaK einem der Anspriiche 1 bis 14 
umf asst . 

16. Anordnung nach Anspruch 15, 

2 0 dadurch gekennzeichnet , daS 

die Anordnung 

mindestens einem Datenspeichersystem und/oder 
mindestens einem Computer system, das (die) 
lesend und/oder schreibend auf die Speicher- 
25 medien zugreift (zugreifen) , und/oder 

mindestens eine zwischen das (die) Computersy- 
stem(e) und das (die) Datenspeichersystem (e) 
geschaltete Kontroller-Einheit zur Steuerung 
des Verfahrens randomisierten Datenspeicherung 

3 0 umf asst. 



17, Anordnung nach Anspruch 16, 
dadurch gekennzeichnet, daK 
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das Datenspeichersystem 

Festplattenf elder und/oder 

als Web-Cashes ausgebildete Zwischenspeicher 
lomfasst . 

5 

18. Anordnung nach einem der Anspriiclie 15 bis 11, 
dadurch gekennzeichnet , dafi 

die Anordnung mindestens eine zwischen das (die) 
Computersysteni(e) und das (die) Datenspeicher- 
10 system (e) geschaltete Kontroller-Einheit zur 

Steuerung des Verfahrens zur randomisierten Daten- 
speicherung ximfasst. 

19. Anordnung nach Anspruch 18, 

15 dadurch gekennzeichnet, daiS 

die Anordnung mindestens ein iiber die Kontroller- 
Einheit auf die Speichermedien zugreifendes 
Computersystem umfasst. 

2 0 20. Anordnung nach einem der Ansprtiche 15 bis 19, 

dadurch gekennzeichnet, daS 

das Verfahren zur randomisierten Datenspeicherung 
als Hardware-RAID-Verf ahren in der Kontroller-Ein- 
heit implementiert ist. 

25 

21. Anordnung nach einem der Anspriiche 15 bis 20, 

dadurch gekennzeichnet, daS 

die Anordnung 

mindestens ein dediziertes, tiber Mittel zum 

3 0 Datenaustausch mit Speichermedien und Computer- 

systemen der Anordnung verbundenes Computer- 
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system (SAN- Appliance) zur Koordination der 
Datenspeicherung und/oder 

liber Mittel zxim Datenaustausch mit Speicher- 
medien und Computersystemen der Anordnung ver- 
5 bundene Rechenressourcen (In-Band-Appliances) 

zur Verteilung der Datenblocke 
umf asst . 

22. Anordnung nach einem der Ansprtiche 15 bis 21, 
10 dadurch gekennzeichnet , daS 

die Anordnung heterogene Speicliermedien umf asst. 



23. Computerprogrammprodukt , das ein computerlesbares 
Speichermedium umfaSt, auf dem ein Prograram ge- 

15 speichert ist, das es einem Computer ermoglicht, 

nachdem es in den Speicher des Computers geladen 
worden ist, ein Verfahren zur randomisierten 
Datenspeicherung in Speichernetzwerken und/oder 
einem Intranet und/oder dem Internet durchzu- 

20 fuhren, wobei die randomisierte Datenspeicherung 

die Verf ahrensschritte gemalS einem der Ansprtiche 1 
bis 14 umfaSt. 



24. Computerlesbares Speichermedium, auf dem ein Pro- 
25 gramm gespeichert ist, das es einem Computer er- 

moglicht, nachdem es in den Speicher des Computers 
geladen worden ist, ein Verfahren zur randomi- 
sierten Datenspeicherung in Speichernetzwerken 
und/oder einem Intranet und/oder dem Internet 
3 0 durchzufiihren, wobei die randomisierte Datenspei- 

cherung die Verf ahrensschritte gemaS einem der 
Anspruche 1 bis 14 umfaKt. 
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